iT邦幫忙

2023 iThome 鐵人賽

DAY 13
0
AI & Data

打造數據科學之路:資料分析與機器學習的完整指南系列 第 13

鐵人賽第十三天~ 機器學習介紹

  • 分享至 

  • xImage
  •  

~今天要分享的是「機器學習介紹」~

經過前面幾天的學習,恭喜大家即將迎來一個全新的主題,那就是機器學習!

在進入正題之前,要先學會機器學習裡三種重要的學習方式,分別是:

  • 監督式學習:需事先標記答案,模型會從訓練資料學習判斷正確的答案,使用時機通常為分類和迴歸問題
  • 非監督式學習:不需事先標記答案,模型會自己從訓練資料中找到合適的答案,使用時機通常為集群分析和降維分析等需求
  • 強化式學習:不需事先標記答案,模型會從與環境的互動中獲得的正懲罰與負懲罰找到最佳的答案,使用時機通常為決策和控制問題

接下來要談論混淆矩陣,這是在評估分類問題模型時很重要的觀念:
https://ithelp.ithome.com.tw/upload/images/20230928/20163290MzU6KrTJ4u.png
可能有些人(包括我)一開始在看這張表的時候常常會被搞混,後來我找到記這張表的方法:

  1. 表的最上面為實際,表的最左邊為預測
  2. 英文字第一個字母為T還是F看實際與預測是否一樣,第二個字母看預測為真(T)還是假(F)
  3. 型一錯誤在右上,型二錯誤在左下

註:型一錯誤為α,也稱顯著水準;型二錯誤為(1 –β),也稱(1-檢定力)

最後在做分類問題的模型評估時,常見的評估指標有:準確率、精確率、召回率、F1-score。
準確率:(TP+TN) / (TP+FP+FN+TN)
精確率:TP / (TP+FP)
召回率:TP / (TP+FN)
F1-score:2/(1/精確率+1/召回率)

而評估回歸問題模型時使用到的指標為R-squared(判定係數)與RMSE(均方根誤差)。
R-squared:範圍在0到1之間,越接近1表示模型解釋能力越好
RMSE:RMSE越小表示模型的預測誤差越小,代表預測的結果接近真實的數據


上一篇
鐵人賽第十二天~主成分分析
下一篇
鐵人賽第十四天~支持向量機介紹
系列文
打造數據科學之路:資料分析與機器學習的完整指南30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言